Le catalogue Ecosphères a pour vocation de faciliter l'identification sur chaque territoire des données utiles à l'appui des politiques publiques (diagnostic, planificaiton, suivi). Dans le cadre de ces observations, nous nous intéressons au potentiel de priorisation des données remontées lors d'une recherche à partir des métadonnées disponibles au regard de critères thématiques, géographiques, temporels, d'accès à la donnée et enfin de fiabilité. Nous nous appuierons sur une sélection de métadonnées parmi les champs décrits dans des documents de références tels que la documentation du profile GeoDCAT-AP et le guide de saisie des éléments de métadonnées INSPIRE .
Les métadonnées recueillies par le POC CKAN Ecosphères à partir des points de moissonnage sont à la base de ces observations. Les métadonnées sur les jeux de données sont entreposés dans les tables package et package_extra de la base de données CKAN , également disponibles par API suivant le schéma Ecosphères DCAT compatible.
Taux de remplissage
Observations
-Remplissage
-Unicité
-Recensement d’anomalies (e.g. titres anormalement courts)
Traitements
-Comptabilisation du nombre de mots : chaînes de caractères séparées par un espace.
Nombre de datasets avec un titre, unicité
| datasets | title | |
|---|---|---|
| Loading... (need help ?) |
Exemples de titres monoblocs
| title | notes | |
|---|---|---|
| Loading... (need help ?) |
Observations
-Remplissage
-Unicité
-Recensement d’anomalies (e.g. notes anormalement courtes).
Traitements
-Comptabilisation du nombre de mots : chaînes de caractères séparées par un espace.
Nombre datasets avec notes, unicité
| datasets | notes | |
|---|---|---|
| Loading... (need help ?) |
Pics de jeux de données comportant des notes de même longueur : [60, 86, 95, 107, 153, 182, 481]
Jeux de données aux notes "monoblocs"
| title | notes | |
|---|---|---|
| Loading... (need help ?) |
Données correspondant au pic de longueur de 60 mots (notes)
| title | notes | |
|---|---|---|
| Loading... (need help ?) |
Données correspondant au pic de longueur de 86 mots (notes)
| title | notes | |
|---|---|---|
| Loading... (need help ?) |
Données correspondant au pic de longueur de 95 mots (notes)
| title | notes | |
|---|---|---|
| Loading... (need help ?) |
Données correspondant au pic de longueur de 107 mots (notes)
| title | notes | |
|---|---|---|
| Loading... (need help ?) |
Données correspondant au pic de longueur de 153 mots (notes)
| title | notes | |
|---|---|---|
| Loading... (need help ?) |
Données correspondant au pic de longueur de 182 mots (notes)
| title | notes | |
|---|---|---|
| Loading... (need help ?) |
Données correspondant au pic de longueur de 481 mots (notes)
| title | notes | |
|---|---|---|
| Loading... (need help ?) |
Observations
-Remplissage
-Nombre de datasets par département
-Nombre de dataset par superficie de bounded box suivant 4 catégories : intra-départemental, départemental, régional, supranational
-Observation des datasets à emprise nationale
Traitements
-Données filtrées sur le territoire métropolitain (zones terrestres) par jointure spatiale des centroides des bounded boxes avec les géométries des départements métropolitains
Nombre de datasets avec bounded boxes
| package_id | bbox | |
|---|---|---|
| Loading... (need help ?) |